查看原文
其他

谷歌在机器学习实现量子优势方面取得突破

光子盒研究院 光子盒 2021-12-15
光子盒研究院出品


近年来,量子计算在理论和实践方面都取得了飞速发展,并有望在实际应用中产生潜在的影响。人们感兴趣的一个关键领域是量子计算机可能如何影响机器学习。最近,谷歌和加州理工学院的研究人员通过实验证明了,量子计算机能够自然地解决某些输入之间具有复杂关联的问题,这对于传统或“经典”计算机来说是非常困难的。这表明在量子计算机上构建的学习模型对于特定的应用可能会更加强大,可能具有更快的计算速度、在更少的数据上更好的泛化,亦或是两者都有。因此,了解在什么情况下可以实现这种“量子优势”(quantum advantage)是非常有意义的。

量子优势的概念通常用计算优势来表述。也就是说,给定一些具有明确定义的输入和输出的任务,在可比的运行时间中,量子计算机能否获得比经典计算机更准确的结果呢?量子计算机被怀疑具有压倒性优势的算法有很多,比如Shor的分解大质数乘积的分解算法 (与RSA加密相关),或者量子系统的量子模拟。然而,解决问题的难度以及量子计算机的潜在优势可能会受到数据可用性的极大影响。因此,了解量子计算机何时可以帮助机器学习不仅取决于任务,还取决于可用的数据,必须考虑以上两个问题才能形成对此的完整理解。

近日在《自然·通讯》上发表的“数据在量子机器学习中的力量”中,研究人员剖析了机器学习中的量子优势问题,从而可以更好地了解它将在何时适用。他们展示了问题的复杂性如何随着数据的可用性而正式变化,以及这如何能够提升经典学习模型的能力,从而与量子算法竞争。

然后,谷歌开发了一种实用的筛选方法,用于筛选当在核方法(Kernel Methods)的上下文中选择的一组数据嵌入时可能具有量子优势的情况。他们使用筛选方法和对学习边界的见解来介绍一种新方法,选择了从量子计算机到经典空间的特征映射的各个方面。这使研究人员能够从经典机器学习中获得更多的见解,从而使量子方法具有迄今为止量子学习优势中最好的经验分离。


量子优于经典计算机的思想通常是以计算复杂度等级为框架的。例如分解大数和模拟量子系统之类的例子被归类为有界量子多项式时间(BQP)问题,人们认为量子计算机比经典系统更容易处理这些问题。在经典计算机上很容易解决的问题称为有界概率多项式(BPP)问题。

研究表明,带有来自量子过程的数据的学习算法,例如聚变或化学反应等自然过程,形成了一类新的问题(称之为BPP/Samp),可以有效地执行一些没有数据的传统算法无法完成的任务,并且是可以使用P/poly有效解决的问题的子类。这表明,对于某些机器学习任务,理解量子优势也需要检验可用的数据。



结果表明,优势的潜力取决于数据的可用性,人们可能会问,一个从业者如何快速评估他们的问题是否适合量子计算机。为了解决这个问题,谷歌开发了一个工作流来评估核学习框架内的优势潜力。他们进行了许多检验,其中最强大和信息量最大的是谷歌开发的一种新的几何检验方法。

在量子机器学习方法中,例如量子神经网络或量子核方法,量子程序通常分为两部分,数据的量子嵌入(使用量子计算机的特征空间的嵌入映射)和评估应用于数据嵌入的函数。在量子计算的背景下,量子核方法利用传统的核方法,但使用量子计算机来评估量子嵌入上的部分或全部核,这与经典嵌入具有不同的几何性质。据推测,量子嵌入可能会产生量子优势,它可能比任何可接近的经典几何更适合于特定的问题。

谷歌开发了一个快速而严格的检验方法,可用于快速将特定的量子嵌入、核和数据集与一系列经典核进行比较,并评估是否有任何机会获得量子优势,例如可能的标签函数,比如那些用于图像识别任务的标签函数。他们定义了一个几何常数g,它量化了理论上可以缩小差距的数据量。这是一种非常有用的技术,可以根据数据约束来决定量子解决方案是否适合给定的问题。


几何检验揭示了,现有的量子核经常受到一种易于经典化的几何结构的影响,因为它们鼓励记忆,而不是理解。这启发了谷歌开发投影量子核的想法,其中量子嵌入被投影回经典表示。虽然这种表示仍然很难用经典计算机直接计算,但与完全停留在量子空间相比,它具有许多实际优势。

    

几何量g量化了量子优势的潜力,描述了几种嵌入,包括这里介绍的投影量子核。

通过有选择地投影回经典空间,研究人员我们可以保留量子几何中仍然难以经典模拟的方面,但现在开发距离函数更容易,因此,核在输入的适度变化下与原始量子核相比表现得更好。此外,投影量子核有助于更好地与经典开发的强大非线性核(例如,平方指数核)整合,这在原生量子空间中更具挑战性。


与以前的方法相比,这种投影量子核具有许多优点,包括改进了描述现有嵌入的非线性函数的能力,减少了将核从二次方处理成与数据点数量成线性关系所需的资源,以及在较大的规模下更好地泛化的能力。核还有助于扩展几何量g,这有助于确保量子优势的最大潜力。


几何检验量化了所有可能的标签函数的潜在优势,但实际上谷歌最感兴趣的是特定的标签函数。使用学习理论方法,他们还限制了特定任务的泛化误差,包括那些明确起源于量子的任务。由于量子计算机的优势依赖于它同时使用多个量子比特的能力,但以前的方法在量子比特数量上的扩展性很差,因此重要的是要验证相当大的量子比特规模(> 20 ),以确保有方法可能扩展到真正的问题。在谷歌的研究中,他们验证了多达30个量子比特,这是由开源工具TensorFlow-Quantum实现的,能够扩展到千万亿次计算。

有趣的是,研究表明,当提供足够的数据时,许多自然量子问题,甚至多达30个量子比特,都可以通过经典学习方法轻松地处理。因此一个结论是,即使对于一些看起来像量子的问题,由数据赋能的经典机器学习方法也可以与量子计算机的能力相匹敌。然而,将几何构造与投影量子核结合使用,他们能够构建一个数据集,该数据集展示了量子模型相对于经典模型的经验学习优势。因此,虽然在自然问题中找到这样的数据集仍然是一个悬而未决的问题,但他们能够在这种情况下证明标签函数的存在。尽管这个问题是经过人为设计的,并且量子计算优势需要更大和更具挑战性的嵌入,但这项工作是理解数据在量子机器学习中的作用的重要一步。
 
预测准确度作为量子比特数(n)的函数,设计的目的是最大限度地发挥量子模型中学习优势的潜力。数据显示为两种不同大小的训练数据(N)。


预测准确度作为量子比特数(n)的函数,设计的目的是最大限度地发挥量子模型中学习优势的潜力。数据显示为两种不同大小的训练数据(N)。
对于这个问题,谷歌扩大了量子比特(n)的数量,并将投影量子核的预测精度与现有的核方法和他们数据集中最好的经典机器学习模型进行了比较。此外,从这些结果中得出的一个关键结论是,尽管谷歌展示了量子计算机具有优势的数据集的存在,但对于许多量子问题,经典学习方法仍然是最好的方法。在讨论学习问题中的量子优势时,了解数据如何影响给定问题是一个需要考虑的关键因素,这与传统的计算问题不一样。


在考虑量子计算机辅助机器学习的能力时,研究人员已经表明数据的可用性从根本上改变了这个问题。在谷歌的工作中,他们开发了一套实用的工具来检验这些问题,并使用它们来开发一种新的投影量子核方法,该方法与现有方法相比具有许多优势。谷歌进行了迄今为止最大的数字演示(30量子比特),展示了量子嵌入的潜在学习优势。虽然在现实世界应用上的完整计算优势还有待观察,但这项工作有助于为前进的道路奠定基础。

参考链接:
https://ai.googleblog.com/2021/06/quantum-machine-learning-and-power-of.html
 
—End—

相关阅读:
通往百万量子比特!一图看懂谷歌量子计算之旅

当量子计算遇上机器学习:推荐五门基础课程

在量子计算机上运行机器学习模型,IBM Qiskit添加ML模块

量子机器学习的里程碑!CQC证明量子计算机可进行推理

量子机器学习将首次用于癌症治疗!CQC再下一城
IonQ和QC Ware在量子机器学习领域取得突破


#光子盒社群招募中#

进入光子盒社群,与我们近距离互动,了解量子领域更多产业、商业、科技动态,领取量子技术产业报告。
 
现添加社群助手微信Hordcore即可进群 ,与我们一起展望未来!

你可能会错过:
: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存